FakeQuantWithMinMaxVars ======================= 对输入数据执行逐元素伪量化运算。该算子通过给定的最小/最大值(min_val/max_val)计算缩放因子(scale)和零点(zero_point),将浮点输入模拟量化到指定的整数范围(quant_min/quant_max),然后再将其反量化回浮点数。 .. math:: scale = \frac{max\_val - min\_val}{quant\_max - quant\_min} .. math:: output_i = \left( \text{round} \left( \frac{\text{clamp}(input_i, nudge\_min, nudge\_max) - nudge\_min}{scale} \right) \right) \times scale + nudge\_min 输入: - **src** - 输入数据地址。 - **min_val** - 浮点范围的最小值。 - **max_val** - 浮点范围的最大值。 - **length** - 计算长度。 - **quant_min** - 量化后的整数最小值(例如 0 或 -128)。 - **quant_max** - 量化后的整数最大值(例如 255 或 127)。 - **symmetric** - 是否使用对称量化(bool 类型)。若为 true,则范围调整为关于 0 对称。 - **core_mask(int, 可选)** - 核掩码(仅适用于共享存储版本)。 输出: - **output** - 伪量化后的计算结果地址。 支持平台: ``FT78NE`` ``MT7004`` .. note:: - FT78NE 支持:fp32 (fp) - MT7004 支持:fp16 (hp), fp32 (fp) - 该算子内部包含 "Nudge" 逻辑,即会自动调整零点(Zero Point)使其为整数,并根据调整后的零点重新计算实际使用的浮点范围(nudge_min/nudge_max)。 **共享存储版本:** .. c:function:: void fp_fake_quant_with_min_max_vars_s(float* src, float min_val, float max_val, float* output, int length, int quant_min, int quant_max, bool symmetric, int core_mask) .. c:function:: void hp_fake_quant_with_min_max_vars_s(half* src, half min_val, half max_val, half* output, int length, int quant_min, int quant_max, bool symmetric, int core_mask) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 13 // FT78NE 示例:fp32 类型共享存储多核计算 #include #include #include "78NE/utils.h" int main(int argc, char* argv[]) { float *input = (float *)0xA0000000; float *output = (float *)0xB0000000; float min_v = -10.0f; float max_v = 10.0f; int length = 960001; int core_mask = 0b1011; fp_fake_quant_with_min_max_vars_s(input, min_v, max_v, output, length, 0, 255, false, core_mask); return 0; } **私有存储版本:** .. c:function:: void fp_fake_quant_with_min_max_vars_p(float* src, float min_val, float max_val, float* output, int length, int quant_min, int quant_max, bool symmetric) .. c:function:: void hp_fake_quant_with_min_max_vars_p(half* src, half min_val, half max_val, half* output, int length, int quant_min, int quant_max, bool symmetric) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 12 // MT7004 示例:fp16 (half) 类型私有存储单核计算 #include #include int main(int argc, char* argv[]) { half *input = (half *)0x10000000; half *output = (half *)0x10001000; half min_v = (half)-5.0f; half max_v = (half)5.0f; int length = 1024; hp_fake_quant_with_min_max_vars_p(input, min_v, max_v, output, length, 0, 255, true); return 0; }